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Abstract of DE1 001 4757 
The knowledge extraction method uses 
warehouse processing of objects or object 
positions for extraction of information from a 
computer databank system, for providing 
answers to received questions. Object 
characteristics and object characteristic 
fragments are located in an index databank 
and evaluated for identifying a number of sub- 
questions, with recursive evaluation of the 
latter and collection of the evaluation results 
for forming an overall evaluation of the 
question. Also included are Independent 
claims for the following: (a) a distributed 
computer databank system; (b) a method for 
processing a question for information retrieval 
from a databank; (c) a computer program 
product for processing a question for 
information retrieval from a databank system 
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® System und Verfahren zur Wissensextraktion 

® Eine Informationswiedergewinnungseinrichtung fur 

die Verarbeitung einer Abfrage zur Wiedergewinnung von 

Informationen aus einer Datenbank besitzt einen Mecha- 

nisrnus zum Auffinden einer Anzahl an Merkmalen und 

Merkmalsfragmenten in einer Indexdatenbank; einen 

Evaluierungsmechanismus zur Identifizierung einer An- 
zahl an Unterabfragen einer Anzahl an Ebenen, die in der 

Abfrage enthalten sind, und zur rekursiven Evaluierung 

der Unterabfrage unter Verwendung der einzelnen gefun- 

denen Merkmale und Merkmalsfragmente; und einen Me- 

chanismuszum Sammeln und Speichern einer Anzahl an 

Ergebnissen der rekursiven Evaluierung der Abfrage und 

der Unterabfrage nach der Berechnung eines Gesamter- 

gebnisses der Abfrage. Ein solches System kann den Be- 

darf an herkommlichen Wiedergewinnungssystemen fur 

die Schaffung neuer, separater, zentralisierter Repiiken in- 

nerhalb des Data Warehouse der Daten, die in den ver- 

schiedenen externen Datenbanken gespeichert sind, be- 
^ seitigen. Die Erfindung kann somit die Probleme der Re- 

plizierung solcher Daten in herkommlichen Systemen 
1"^ vermeiden, in denen die Daten veraltet sein konnen oder 
W Fehlern unterliegen konnen, die wahrend der Replazie- 
^ rung fur die Datenlagerhaltung entstehen. Stattdessen 

kann das Data Warehouse eine Indexdatenbank enthal- 
^ ten, die Eintrage speichert, welche Daten hinsichtlich der 
q in den externen Datenbanken gespeicherten Informatio- 
q nen zur Verfugung stellen, wie zum Beispiel Informations- 
^ positionsbezeichner fur diese Daten innBrhalb jener ... 

UJ 

O 



I ~H ii 2 i ^ 
Ur& QQ 



Lokales Netzwerk, 110 



Warehousing-Knoten, 108 



BUNDESDRUCKEREI 08.01 101 390/749/1 



14 



DE 100 

l 

Beschreibung 

VERWANDTE ANMELDUNGEN 

Diese Anmeldung ist verwandt mit und beansprucht Prio- 
riat uber die gleichzeitig anbangige, gemeinsam abgetre- 
tene, noch unvollstandige US-Patentanmeldung Nr. 
60/094,350, angerneldet am 28. Juli 1998 von Kenneth P. 
Baclawski, mit dem Titel "Knowledge Extraction System 
and Method"; und der Nr. 60/094,110, angerneldet am 24. 
Juli 1998 von Kenneth P. Baclawski, mit dem Titel "Distri- 
buted Object Search System and Method"; deren Oflenba- 
rung hiermit als Referenz aufgenommen wird. Diese An- 
meldung betrifft auch die ebenfalls anhangige, gemeinsam 
abgetretene US-Anmeldung Nr. xxx,xxx, angerneldet am 
selben Tag wie diese, von Kenneth P. Baclawski, mit dem 
Titel "Distributed Computer Database System And Method 
For Performing Object Search", deren Offenbarung biermit 
als Referenz aufgenommen wird. 

BEREICH DHR HRF1NDUNG 

Die Erfindung betrifft ein Computer-Datenbanksystem, 
und insbesondere verteilte Computer-Datenbanksysteme. 

HINTERGRUND DER ERJFTNDUNG 

Organisationen sammeln routinernaBig groBe Datenmen- 
gen uber ihre Kunden, Produkte, Arbeitsablaufe und Ge- 
schaftsaktivitaten. Die in diesen Daten enthaltenen Erkennt- 
nisse konnen wichtige Hilfen zum Marketing, zur Verringe- 
rung der Betriebskosten sowie fur strategische Entschei- 
dungsfindungen darstellen. Wenn es zum Beispiel eine 
starke Beziehung zwischen den Kunden, die ein Produkt 
kaufen mochten, und jenen Kunden, die ein anderes Produkt 
kaufen mochten, gibt, dann besteht die Wahrscheinlichkeit, 
daB jene Kunden, die dieses Produkt gekauft haben, auch In- 
teresse am Kauf des anderen Produkts haben konnen. 

Die analytische Verarbeitung von Daten erfolgt primar 
unter Verwendung stalislischer Methoden zum Extrahieren 
von Korrelationen und anderen Mustern in den Daten. Diese 
Art der Verarbeitung wird unter anderem als "Data Mining" 
(Datenerforschung), Wissenserkundung und Wissensextrak- 
tion bezeichnet. Eine Suche nach einem spezifischen Muster 
oder einer Art Yon Muster in einer groBen Sammlung von 
Daten wird als Musterabfrage bezeichnet 

GroBe Unternehmen besitzen und verwalten typischer- 
weise Datenbanken, von denen es sich bei vielen urn Trans- 
aktionsdatenbanken handelt. Die Anforderungen dieser Da- 
tenbanken stehen oftmals in Konflikt mit den Anforderun- 
gen des "Data Minings". Trans aktionsdatenbanken werden 
in Echtzeit durch kleine Transaktionen aktualisiert Beim 
Data Mining hingegen werden groBe Musterabfragen ver- 
wendet, die nicht in Echtzeit slattfinden miissen. Um diesen 
Konflikt zu losen, wird nun allgemein so vorgegangen, daB 
Daten aus unterschiedlichen Quellen in eine zentralisierte 
Rcssourcc gcladcn werden, die man als Data Warehouse 
(Datenlagerhaus) bezeichnet. 

Das Herunterladen und Zentralisieren der Daten aus un- 
terschiedlichen, oft getrennten Quellen erfordert die Durch- 
fiihrung zahlreicher Aufgaben. Die Daten miissen aus den 
Quellen extrahiert werden; sie miissen in ein gemeinsanies, 
integriertes Datenmodell umgewandelt werden; sie miissen, 
um fehlerhafte oder falsche Daten zu beseitigen oder zu kor- 
rigieren, gereinigt werden, und schlieBlich miissen sie im 
zentralen Warehouse integriert und zu einer neuen Daten- 
bank zusammengefafit werden, in der alle Daten gespeichert 
sind. Dariiber hinaus muB sichergestellt werden, daB samtli- 
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che Vorkommen jeder Geschaftseinheit, wie zum Beispiel 
Kundc, Produkt oder Mitarbcitcr, korrckt identiriziert wur- 
den. Dieses Problem ist als referentielle Integritat bekannt 
All dies sind schwierige Aufgaben, besonders jedoch das Si- 
5 cherstellen der referentieUen Integritat, wenn die von den 
Datenbanken heruntergeladenen Daten die Geschaftseinhei- 
ten geringrugig anders identifizieren. Bei der Technologie 
des Standes der Technik werden Daten in einer vom Data 
Mining unabhangigen Aktivitat in das Data Warehouse ge- 
io laden. Im Gegensatz zum Data Mining, fiir welches es eine 
umfangreiche Forschungsliteratur und viele kommerzielle 
ProdukLe gibt, besitzt das DaLa Warehousing keine starke 
theoretische Grundlage und nur wenige gute kommerzielle 
Produkte. 

15 Da Data Warehouses viele unterschiedliche Datenquellen 
integrieren, ist es notwendig, ein integriertes Datenmodell 
fur das Data Warehouse sowie eine Datenabbildung zu 
schaflen, welches Daten von den einzelnen Datenquellen 
extrahiert, umwandelt und reinigt Es ist im Stand der Tech- 

20 nik bekannt, daB sich reichere Datenmodelle, wie zum Bei- ' 
spiel objektorientierte Datenmodelle, besser fur die Kes tie- 
gun g eines solchen integrierten Datenmodells und fur die 
Definierung der Datenabbildung eignen als begrenzte Da- 
tenmodelle, wie zum Beispiel das relationale Modell. Den- 

25 noch verwenden die meisten Data Warehouses (Datenlager- 
hauser) noch iminer eine flache Eintragsslruktur, wie zum 
Beispiel das relationale Modell. Relationale Datenbanken 
besitzen eine sehr lirnitierte Datenstruktur, so daB die Erzeu- 
gung komplexerer Datenstrukturen muhevoll und fehler- 

30 trachtig ist. Einige der Arten von Daten, die fur eine Spei- 
cheruhg in einer relationen Datenbank nur sehr schlecht ge- 
eignet sind, waren: Textdaten im allgemeinen, Hypertextdo- 
kumente im besonderen, Bilder, Tone, Multimediaobjekte 
und Attribute mit mehreren Werten. Relationale Datenban- 

35 ken sind auch schlecht fur die Darstellung von Dateneintra- 
gen geeignet, die eine sehr groBe Anzahl an moglichen At- 
tributen besitzen, von denen nur wenige von einem Daten- 
eintrag verwendet werden. 

Eine Objektdatenbank besteht typischerweise aus einer 

40 Sammlung von Daten oder Informationsobjekten. Jedes In- 
formationsobjekt wird auf einzigartige Weise durch einen 
Objektbezeichner (OID) gekennzeichnet Jedes Informati- 
onsobjekt kann Merkmale besitzen, und manche Merkmale 
konnen zugeordnete Werte besitzen. Informationsobjekte 

45 konnen auch andere Informationsobjekte enthalten oder auf 
diese verweisen. 

Um das Auffinden von Informationen in einer Datenbank, 
einschlieBlich einer Data Warehouse-Datenbank, zu unter- 
stiitzen, werden spezielle Suchstrukturen verwendet, die 

50 man als Indexe bezeichnet GroBe Datenbanken erfordern 
entsprechend groBe Indexstrukturen, um Zeiger zu den ge- 
speicherten Daten zu setzen und zu verwalten. Eine solche 
Indexstruktur kann groBer sein als die Datenbank selbsL Die 
Technologie des Standes der Technik erfordert einen separa- 

55 ten Index fur jedes Attribut oder MerkmaL Diese Technolo- 
gie kann erweitert werden, um eine Indizierung einer klei- 
ncn Anzahl von Attributcn oder Mcrkmalcn in cincr einzel- 
nen Indexstruktur zu ermoglichen, doch fiinktioniert diese 
Technologie nicht sehr gut, wenn es Hunderte oder Tau- 

60 sende von Attributen gibt. Dariiber hinaus gibt es einen be- 
trachtlichen Zusatzaufwand im Zusammenhang mit der 
Wartung einer Indexstruktur. Dies schrankt die Anzahl der 
Attribute oder Merkmale, die indiziert werden konnen, ein, 
so daB jene, die unterstiitzt werden, sehr sorgfaltig ausge- 

65 wahlt werden miissen. Fur Iransaktionsdatenbanken ist fur- 
gew6hnlich ein gutes Verstandnis der damit verbundenen 
Arbeitslast vorhanden, so daB es mSglich ist, die Indexe so 
zu wahlen, daB die Leistung der Datenbank optimiert wird. 
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Fur ein Data Warehouse gibt es jedoch normalerweise keine 
gut dcfinicrtc Arbcitslast, so daB cs vicl schwicrigcr ist, die 
zu indizierenden Attribute auszuwahlen. 

Weitere Informationen bezuglich der zuvor genannten 
Konzepte konnen den folgenden Publikationen entnommen 5 
werden: 

1 L. Aiello, J. Doyle, und S. Shapiro, Herausgeber. Proc. 
Fifth Intern. Conf. an Principles of Knowledge Representa- 
tion and Reasoning. Morgan Kaufman Publishers, San Ma- 
teo, CA, 1996. 10 

2 K. Baclawski, Distributed computer database system and 
method, Dezember 1997. US-Patent Nr. 5,694,593. Abge- 
treten an Northeastern University, Boston, MA. 

3 A. Del Bimbo, Herausgeber. The Ninth International Con- 
ference an Image Analysis and Processing, Band 1311. 15 
Springer, September 1997. 

4 N. Fridman Nov.. Knowledge Representation for Intelli- 
gent Information Retrieval in Experimental Sciences. Dok- 
torarbeit, College of Computer Science, Northeastern Uni- 
versity, Boston, MA, 1997. 20 

5 M. Hurwicz. Take your data to the cleaners. Byte Maga- 
zine, Januar 1 997. 

6 Y. Ohta. Knowledge-Based Interpretation of Outdoor Na- 
tural Color Scenes. Pitman, Boston, MA, 1985. 

7 A. Tversky. Features of similarity. Psychological review, 25 
84(4):327-352,Julil977. 

8 S. Weiss and N. Indurkhya. Predictive Data Mining: A 
Practical Guide. Morgan Kaufmann Publishers, Inc., San 
Francisco, CA, 1998. 

9 J.-L. Weldon and A. Joch. Data warehouse building 30 
blocks. Byte Magazine, Januar 1997. 

Die OfFenbarungen der im Abschnitt "Hintergrund der 
Erfindung" erwahnten Veroffentlichungen werden bierrnit 
als Referenz aufgenommen. 

Es ware wiinschenswert, verbesserte Systeme fur das 35 
Data Warehousing und das Data Mining zu schaffen, welche 
viele der leistungsbezogenen und anderen Probleme und 
Einschrankungen der Systeme des Standes der Technik be- 
seitigen. 

40 

ZUS AMMENFASSUNG DER ERFINDUNG 

Die Yorliegende Erfindung kombiniert die zwei Aktivita- 
ten des Data Warehousings und des Data Minings, wodurch 
die Grundlage und Unterstutzung fur das Data Warehousing 45 
verbessert werden. Der BegrifF Wissensextraktion wird irh 
folgenden fur die Integration des Data Warehousing und der 
Data Mining-Aktivitaten verwendet. 

Die Erfindung beruht auf einem System und einem Ver- 
fahren zur Verarbeitung einer Abfrage von einem An wen- 50 
der, einschlieBlich zum Beispiel einer Abfrage fur die Wie- 
dergewinnung von Informationen aus dem Data Warehouse. 
Das System umfaBt einen Mechanismus zum Finden einer 
Anzahl an Merkmalen und Merkinalsfragmenten in einer In- 
dexdatenbank; einen Evaluierungsmechanismus zur Identi- 55 
fizierung einer Anzahl an Unterabfragen einer Anzahl an 
Ebcncn, die in der Abfrage cnthaltcn sind, und zur rckursi- 
ven Evaluierung der Unterabfragen mit Hilfe der einzelnen 
gefundenen Merkmale und Merkmalsfragmente; und einen 
Mechanismus zum Sammeln und Speichem einer Anzahl an 60 
Ergebntssen der rekursiven Evaluierung der Abfrage und 
der Unterabfragen nach dem Berechnen des Gesamtergeb- 
nisses der Abfrage. 

Mit dem hierin verwendeten BegrifT "Evaluierung" wird 
ein ProzeB bezeichnet, durch den eine Antwort auf eine Ab- 65 
frage erzeugt wird, gekennzeichnet durch die Wiedergewin- 
nung von Informationen, Informationspositionsbezeichnern 
oder Daten, welche die Informationen betreffen, und welche 



den in der Abfrage angegebenen Kriterien entsprechen. Bei 
der rekursiven Evaluierung handelt cs sich um cincn Typ der 
Abfrageevaluierung, bei dem neue Abfragen, sogenannte 
Unterabfragen, von der Abfrage erzeugt und evaluiert wer- 
den. Die solcherart erzeugten Unterabfragen konnen als 
Knoten in einem Abfragebaum betrachtet werden, dessen 
ursprungliche Abfrage der Basisknoten ist, und wobei jede 
Unter abfrage eine entsprechende Ehene innerhalb des Bau- 
mes einnimmt, die von ihrer Beziehung zu den vorhergehen- 
den Abfragen, von denen sie erzeugt wurde. bestimmt wird. 
Alle Unterabfragen, das heiBt die Vorgangerabfragen und 
Tochtenibfragen, werden rekursiv evaluiert, und die Ergeb- 
nisse werden gesammelt, gespeichert und dem Anwender 
als Antwort auf die Abfrage prasentiert 

Die Erfindung kann den Bedarf an herkommlichen Wie- 
dergewinnungssystemen fur die Schaffung neuer, separater, 
zentralisierter Repliken innerhalb des Data Warehouse der 
Daten in den verschiedenen externen Datenbanken beseiti- 
gen. Die Erfindung kann somit die Probleme der Replizie- 
rung soicher Daten in herkommlichen Systemen vermeiden, 
in denen die Daten veraltet oder Fehlern unterliegen konnen, 
die wahrend der Replizierung fur die Datenlagerhaltung ent- 
stehen. Stattdessen kann das Data Warehouse eine Indexda- 
tenbank enthalten, die Eintrage speichert, welche Daten hin- 
sichtlich der in den externen Datenbanken gespeicherten In- 
fonnationen zur Verfiigung slellen, wie zum Beispiel Infor- 
mationspositionsbezeichner fur diese Daten innerhalb jener 
Datenbanken, relationale Informationen und Statistiken, Die 
Erfindung kann auch ein robustes, vielseitiges Indiziersy- 
stem schaffen. Der Index der Erfindung unterstiitzt zum Bei- 
spiel das Indizieren von karglichen Ein tra gen, die eine groBe 
Anzahl an potentiellen Attributen besitzen, von denen aber 
nur einige wenige in einem bestimmten Dateneintrag ver- 
wendet werden. Die vorliegende Erfindung unterstiitzt zum 
Beispiel auch das Indizieren einer sehr groBen Anzahl an 
Attributen in einer im wesentlichen einheitlichen Daten- 
struktur, wodurch es viel einfacher wird, die zur Erzielung 
einer hohen Leistung erforderlichen Arbeitslastmerkmale zu 
bestimmen. 

. Insbesondere umfafiL das verteille Compuler-Datenbank- 
system gemaB eines Aspektes der Erfindung einen oder 
mehrere Front-End-Computer und einen oder mehrere Com- 
puter-Netzknoten, die durch ein Netzwerk zu einer Data Wa- 
rehouse- und Data Mining-Maschine miteinander verbun- 
den sind, welche Objekte, einschlieBlich Bildem, Tonen und 
Videos, sowie einfachen und strukturierten Text indiziert. 
Ein Objekt wird von einer externen Datenbank iiber einen 
Knoten, der als Warehousing-Knoten bezeichnet wird, vorn 
Netzwerk heruntergeladen. Der Warehousing-Knoten exu-a- 
hiert einige Merkmale aus derh Objekt, f ragmen tiert die ein- 
zelnen extrahierten Merkmale in eine Anzahl an Merkmals- 
fragmenten, und streuspeichert diese Merkmalsfragmente. 
Jedes streugespeicherte Merkmalsfragment wird zu einem 
Knoten im Netzwerk uberlragen, der als Indexknoten be- 
zeichnet wird. Jeder Knoten im Netzwerk, der ein streuge- 
speicbertes Merkmalsfragment empfangt, verwendet das 
streugespeicherte Merkmalsfragment des Objckts, um cine 
Suche in der jeweiligen Partition der Indexdatenbank durch- 
zufiihren. Die Ergebnisse der Suchen in den lokalen Daten- 
banken werden vom Warehousing-Knoten gesammelt. Der 
Warehousing-Knoten verwendet diese Ergebnisse, um zu 
bestimmen, ob das Objekt bereits im Data Warehouse indi- 
ziert wurde. Danach extrahiert der Warehousing-Knoten die 
Merkmale aus dem Objekt, fragrnentiert die Merkmale und 
streuspeichert diese Merkmalsfragmente. Jedes streugespei- 
cherte Merkmalsfragment wird zu einem Knoten im Netz- 
werk Ubertragen. Jeder Knoten im Netzwerk, der ein streu- 
gespeichertes Merkmalsfragment empfangt, verwendet das 
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streugespeicherte Merkmalsfragment des Objekts, urn das 
Mcrknial in seiner jewciligcn Partition dcr Indcxdatcnbank 
zu speichem. 

Bei der Abfrage kann es sich zum Beispiel um eine Mur 
sterabfrage handeln. Eine Musterabfrage ist eine Suche nach 5 
einem Muster in den Daten. Eine Musterabfrage wird von 
einem Anwender an einen der Front- End-Computer ubertra- 
gen, der die Musterabfrage an einen der Tndexknoten, wel- 
cher als Heimknoten bezeichnet wird, der Data Mining-Ma- 
schine weiterleitet Der Heimknoten zerlegt die Musterab- 10 
frage in eine oder mehrere Unterabfragen, wobei jede Unter- 
abfrage im Speicher gespeichert wird und ein Objeklmerk- 
mal enthalt, und ein vom Computer ausfuhrbares Programrn 
implementiert ein Verfahren, wie zum Beispiel eine Berech- 
nung. Die Berechnung kann zusatzlich Unterabfragen um- 15 
fassen. Der Heimknoten fragmentiert die Merkmale der ein- 
zelnen Unterabfragen in ein oder mehrere Unterabfrage- 
merkmalsfragmente und streuspeichert danach die Merk- 
malsfragmente. Jedes Unterabfragemerkmalsfragment wird 
gemaB dem streugespeicherten Merkmalsfragment an einen 20 
Knoten im Netzwerk ubertragen. Jeder Knoten im Netz- 
werk, der eine Unterabfrage empfangt, verwendet das streu- 
gespeicherte Merkmalsfragment der Unterabfrage, um eine 
Suche auf der jeweiligen Partition der Indexdatenbank 
durchzufuhren, und die Daten, auf die dabei zugegriflfen 25 
wird, werden bei der Berechnung der Unterabfrage verwen- 
det Wenn die Berechnung einer Unterabfrage zusatzliche 
Unterabfragen enthalt (und sie kann null, eine oder mehrere 
Unterabfragen enthalten), werden die zusatzlichen Unterab- 
fragen rekursiY evaluiert, und die von der rekursiven Evalu- 30 
ierung erhaltenen Daten werden bei der Berechnung der Un- 
terabfrage verwendet. Die Ergebnisse der Suchen der loka- 
len Indexdatenbanken und die Ergebnisse eventueller rekur- 
siver Evaluierungen werden vom Heimknoten gesammelt 
Die Ergebnisse der Musterabfrage werden vom Heimknoten 35 
bestimmt und dem Anwender zuruckgegeben. 

In einem anderen Aspekt der Erfindung umfaSt ein ver- 
teiltes Computer-Datenbanksystem einen oder mehrere 
Front-End-Computer und einen oder mehrere Computer- 
knolen, die durch ein Netzwerk mileinander verbunden sind, 40 
um als Wissensextraktiorisrnaschine zu fungieren, die so- 
wohl die Data WarehouserAktivitat als auch die Data Mi- 
ning- Aktivitat unterstiitzt. 

'Betrachten wir zuerst die Data Warehousing-Aktivitat. 
Das Herunterladen von Objekten von einer anderen Daten- 45 
bank zum Warehouse wird von einem Warehouse-Knoten 
durchgefuhrt Hinsichtlich eines Objekts, das von einer an- 
deren Datenbank heruntergeladen wird, bestimmt der Ware- 
bousing-Knoten zuerst, ob das Objekt aufgrund eines 
Downloads von einer anderen Datenbank moglicherweise 50 
bereits im Data Warehouse reprasentiert wird. Wenn dies der 
Fall ist, extrahiert der Warehouse-Knoten ein oder mehrere 
Merkmale des Objekts, fragmentiert die einzelnen Objekt- ' 
merkmale in eine Anzahl an Merkmalsfragmenten und 
streuspeichert danach diese einzelnen Merkmalsfragmente. 55 
Ein Anteil eines jeden streugespeicherten Fragments wird 
vom Warehouse- Knoten als Adrcssicrindcx verwendet, 
durch den der Warehouse-Knoten das streugespeicherte Ab- 
fragemerkmal an einen Indexknoten des Netzwerks iiber- 
tragt. Jeder Indexknoten im Netzwerk, der ein streugespei- 60 
chertes Objektmerkmalsfragment empfangt, verwendet das 
streugespeicherte Objektmerkmalsfragment, um eine Suche 
in der jeweiligen Indexdatenbank durchzufuhren. Knoten, 
die Daten finden, welche dem streugespeicherten Objekt- 
merkmal entsprechen, geben die OtDs der Warehouse-Ob- 65 
jekte, welche dieses Merkmalsfragment enthalten, zurtick. 
Solche OIDs werden dann vom Warehouse-Knoten gesam- 
melt, und es wird eine Ahnlichkeitsfunktion berechnet 



Diese Ahnlichkeitsfunktion wird verwendet, um zu bestim- 
mcn, ob das Objekt bcrcits im Data Warehouse gespeichert 
ist. Wenn festgestellt wird, daB das Objekt im Data Ware- 
house reprasentiert wird, wird die OID des Warehouse-Ob- 
jekts fur das heruntergeladene Objekt verwendet Wenn es 
noch nicht reprasentiert wird, wird eine einzigartige OID fur 
das Objekt ausgewahlt Danach extrahiert der Warehousing- 
Knoten Merkmale aus dem Objekt, fragmentiert diese und 
streuspeichert diese Merkmalsfragmente. Ein Anteil eines 
jeden streugespeicherten Fragments wird vom Warehouse- 
Knoten als Adressierindex verwendet, durch den der Ware- 
house-Knoten das streugespeicherte Objeklabfrageinerkinal 
an einen Indexknoten des Netzwerks iibertragt, wo das 
Merkmal im Data Warehouse gespeichert wird. 

Betrachten wir als nachstes die Data Mining- Aktivitat. 
Ein Anwender, der eine Abfrage evaluieren mochte, wie 
zum Beispiel eine Suche nach einem Muster in den Daten 
durchfuhren mochte, iibertragt eine Abfrage zu einem der 
Front-End-Computer, der wiederum die Abfrage an einen 
der Indexknoten im Netzwerk weiterleitet. Der Knoten, der 
die Abfrage empfangt (er wird als Heimknoten des Data 
Warehouse be7eichnet), zerlegt die Abfrage in eine oder 
mehrere Unterabfragen. Eine Unterabfrage urnfaBt ein 
Merkmal und ein vom Computer ausfuhrbares Programrn, 
das ein Verfahren implementiert, wie zum Beispiel eine Be- 
rechnung, welche zusatzliche Unlerabfragen umfassen 
kann. Der Heimknoten speichert diese und fragmentiert die 
Merkmale einer jeden Unterabfrage in ein oder mehrere Un- 
terabfragemerkmalsfragmente, und streuspeichert danach 
die einzelnen Merkmalsfragmente der Unterabfragen. Ein 
Anteil eines jeden streugespeicherten Merkmalsfragments 
wird vom Heimknoten als Adressierindex verwendet, durch 
den der Heimknoten die streugespeicherte Abfrage an einen 
Knoten des Netzwerks iibertragt. Jeder Indexknoten im 
Netzwerk, der eine Unterabfrage empfangt, verwendet das 
streugespeicherte Merkmal, um eine Suche in der jeweiligen 
Indexdatenbank durchzufuhren. Knoten, die Daten finden, 
welche dem streugespeicherten Merkmalsfragment der Un- 
terabfrage entsprechen, flihren die in der Unterabfrage fest- 
gelegte Berechnung durch. Wenn die Berechnung keine zu- 
satzlichen Unterabfragen enthalt, werden die Ergebnisse der 
Berechnung an den Heimknoten zuriickgegeben. Wenn die 
Berechnung jedoch zusatzliche Unterabfragen enthalt, iiber- 
nimmt der Knoten die Roile des Heimknotens im Hinblick 
auf die in der Berechnung enthaltenen Unterabfragen. Insbe- 
sondere streuspeichert der Konten die Merkmalsfragmente 
der enthaltenen Unterabfragen und iibertragt die Unterabfra- 
gen zu anderen Knoten. Dieser ProzeB wird rekursiv fortge- 
setzt, bis die Berechnung volistandig ist, und die endgulti- 
gen Ergebnisse werden an den urspriinglichen Heimknoten 
zunickgesandL Bei Empfang der Ergebnisse der Berech- 
nung fuhrt der Heimknoten eventuell noch verbleibende Da- 
tenaggregationen durch, die von der urspriinglichen Muster- 
abfrage festgelegt wurden, und Qbertragt die Informalionen 
zum Front-End- Knoten. Der Front-End- Knoten formatiert 
die Antwort an den Anwender und iibertragt die formatierte 
Antwort zum Anwender. 

KURZE BESCHREEBUNG DER ZEICHNUNGEN 

Die oben genannten sowie weitere Vorteile der Erfindung 
konnen besser durch die Bezugnahme. auf die folgende Be- 
schreibung in Verbindung mit den begleitenden Zeichnun- 
gen verstanden werden, in denen: 

Fig. 1 ein Blockdiagramm einer Ausfuhrungsform des 
verteilten Computer-Datenbanksy stems gemSB der Erfin- 
dung ist; 

Fig. 2 ein Blockdiagramm des verteilten Computer-Da- 
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tenbanksystems von Fig, 1 in Ablaufdiagrarnm-Form ist, 
welches cin Verfahren zum Heruntcrladcn von Informatio- 
nen von einer anderen Quelle zum Data Warehouse gemafi 
einer Ausfiihrungsform der Erfindung darstellt; 

Fig. 3 ein Blockdiagramm des verteilten Computer-Da- 5 
tenbanksystems von Fig. 1 in Ablaufdiagramm-Form ist, 
welches ein Verfahren zur Beantwortung einer Abfrage ge- 
mafi einer Ausfuhrungsform der Erfindung darstellt; 

Fig. 4a-Fig. 4e Blockdiagramrne sind, welche Formate 
fur eine Warehouse-Meldung, eine Warehouse-Antwort- io 
Meldung, eine Einfuge-Meldung, eine Unterabfrage-Mel- 
dung bzw. eine Unterablrage-Antwort-Meldung zeigen, wie 
sie in Verbindung mit der Ausfuhrungsform von Fig. 1-3 
verwendet werden konnen; . 

Fig. 5 ein Blockdiagramm eines der Heirnknoten von Fig. 15 
1-3 gemafi einer Ausfuhrungsform der Erfindung ist; 

Fig. 6 ein Blockdiagramm eines Indexknotens von Fig. 
1-3 gemafi einer Ausfuhrungsform der Erfindung ist; und 

Fig. 7 ein Blockdiagramm eines Computersystem gemafi 
einer beispielhaften Ausfuhrungsform eines Anwendercom- 20 
puters, eines Indexknotens bzw. eines Warehouse- Knotens 
ist 

DETAELLEERTE BESCHREEBUNG DER BEVORZUG- . 

TENAUSF0HRUNGSFORM 25 

Bezugnehmend auf Fig. 1 umfafit eine Ausfuhrungsform 
eines verteilten Computer-Datenbanksysterns 100 gemafi 
der Erfindung einen Anwendercomputer 102, der z. B. iiber 
ein Netzwerk 106 mit einem Front-End-Computer 104 in 30 
Verbindung steht. Alternativ dazu kann es sich bei dem 
Front-End-Computer 104 auch urn den Anwender- Compu- 
ter handeln. Der Front- End-Computer 104 steht wiederum 
in Verbindung mit einer Data Warehouse- und Data Mining- 
Maschine, die einen oder mehrere Computerknoten 106, 35 
108 umfafit, die durch ein lokales Netzwerk 11 0 miteinander 
verbunden sind. Die einzelnen Computerknoten 106, 108 
konnen lokale Festplatten 112 umfassen, oder sie kdnnen al- 
ternativ oder zusatzlich dazu Daten von einem Netzwerk- 
Festplatlenserver (nicht abgebildet) erhalten. 40 

Bei den Computerknoten 106, 108 des Data Warehouse 
kann es sich um verschiedene Arten, wie zurn Beispiel In- . 
dexknoten 106 und Warehouse-Knoten 108, handeln. Die 
Knoten 106, 108 des Data Warehouse miissen nicht unter- 
schiedliche Computer reprasentieren. In einer Ausfuhrungs- 45 
form handelt es sich bei dem Data Warehouse um einen ein- 
zelnen Computer, der die Rolle aller Indexknoten 106 und 
Warehouse-Knoten 108 ubernimmt. In einer anderen Aus- 
fuhrungsform wird das Data Warehouse durch separate 
Computer fur jeden Indexknoten 1 06 und jeden Warehouse- 50 
Knoten 108 dargestellt. 

Fachleute dieses Bereiches werden anerkennen, dafi zahl- 
reiche Variationen moglich sind, die jedoch alle innerhaib 
des Umfangs und Geistes der vorliegenden Erfindung lie- 
gen. 55 

Wenn wir ein beispielhaftes Verfahren 200 betrachten, bei 
dem die Objcktc zucrst hcruntcrgcladcn werden, und indem 
wir auch auf Fig. 2 Bezug nehmen, sehen wir, dafi in einer 
Ausfuhrungsform Objekte von einer externen Datenbank 
201 durch einen oder mehrere Warehouse-Knoten 108 her- 60 
untergeladen werden (Schritt 201). Wenn ein Objekt auf- 
grund eines friiheren Downloads, z. B. von einer anderen 
Datenbank, bereits im Data Warehouse reprasentiert wird, 
extrahiert der Warehouse-Knoten 108 eine Anzahl an Merk- 
malen aus dem Objekt, um das Objekt zu identifizieren, wie 65 
dies im integrierten Datenmodell des Data Warehouses fest- 
gelegt ist. Zum Beispiel kann eine Person durch eine Mitar- 
beiter-'TD", eine Kontonummer, Name, Adresse, Telefon- 
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nummer, E-Mail- Adresse, usw. oder durch eine beliebige 
Kombination aus dicscn identifiziert werden. 

Es kann eine Vielzahl unterschiedlicher Extraktionstech- 
niken verwendet werden. Fiir relationale Attributwerte, wie 
zum Beispiel das Datum einer Transaktion, konnen die 
moglichen Werte in eine Sammlung von aneinander angren- 
zenden, nicht iiberlappenden Bereichen aufgeteilt werden. 
Das derartige Aufteilen von Feldwerten wird als Diskretisie- 
ren bezeichnet Der tats achliche Wert kann auch im Index- 
eintrag enthalten sein. 

'Merkmale werden aus strukturierten Dokumenten extra- 
hiert, indem das Dokument "geparst" wird (das heiBL, es 
wird eine automatische Syntaxanalyse durchgefuhrt), um 
eine Datenstruktur zu erstellen. Danach wird diese Daten- 
struktur in (moglicherweise iiberlappende) Substrukturen 
unterteilt, die als Fragmente bezeichnet werden. Das einer 
Unterabfrage zugeordnete Fragment wird dazu verwendet, 
um ubereinstimmende Fragmente in der Datenbank zu fin- 
den; es wird daher als Muster bezeichnet 

Merkmale, die aus unstrukturierten Dokumenten extra- 
hiert werden, werden in einer Datenstruktur strukturiert, die 
eine Sammlung von untereinander in Beziehung sfehenden 
Substrukturen umfaBt, welche danach in (moglicherweise 
tiberlappende) Komponenten-Substrukturen unterteilt wer- 
den, wie im Falle eines strukturierten Dokuments, und diese 
Komponenten-Substrukturen sind die Fragmente des un- 
strukturierten Dokuments. 

Fiir Medien wie z. B . Tone, Bilder und 'Videos wurde eine 
grofie Vielzahl unterschiedlicher Merkmalsextraktionsalgo- 
rithmen entwickelt, wie zum Beispiel Kantenerkennungs-, 
Segmentierungs- und Objektklasdfizierungsalgorithmen fur 
Bilder. Fourier- und Wavelet-Transformationen sowie zahl- 
reiche Filteralgorithmen werden ebenfalls verwendet, um 
Merkmale aus Bildern und Tonen zu extrahieren. Merkmale 
konnen auch manuell oder halbautomatisch zu einem Objekt 
hinzugefugt werden. Solche hinzugefugten Merkmale wer- 
den als Annotationen oder Metadaten bezeichnet Merkmale 
werden aus Annotationen mit Hilfe einer der oben erwarm- 
ten Techniken extrahiert. Dies hangt davon ab, ob es sich bei 
der Annotation um einen Eintrag einer relationalen Daten- 
bank, ein strukturiertes Dokument oder ein unstrukturiertes 
Dokument handelt. Wenn einem Merkmal Werte zugeordnet 
sind, kdnnen sie diskretisiert werden. Es ist auch moglich, 
Beziehungen zwischen Merkmalen festzulegen. So kann 
zum Beispiel ein Merkmal innerhaib eines anderen Merk- 
mals enthalten sein oder sich neben einem anderen Merkmal 
befinden. Das integrierte Datenmodell spezifiziert die Merk- 
malsextraktionsalgorithmen sowie die Struktur der Merk- 
male. 

Der Warehouse-Knoten 108 codiert jedes Merkmalsfrag- 
ment des Objekts durch Verwendung einer vordefinierten 
Streuspeicherfunktion. Daten im System wurden zuvor mit 
Hilfe dieser Streuspeicherfunktion lokal auf den verschiede- 
nen Indexknoten gespeichert, um einen Index zu den Daten 
in der lokalen Datenbank zu erzeugen. Somit stellt die Ver- 
wendung der selben Strcusrjeicherfunktion zur Erzeugung 
eines Indexes fur die Datcnspcichcrung und zur Erzeugung 
von streugespeicherten Mustern fur ein Objekt sicher, dafi 
Daten wahrend des Speicherns von Daten gleichmafiig iiber 
die Indexknoten 106 des Data Warehouse verteilt werden. 

In einer Ausfuhrungsform besitzt der sich aus der Ver- 
wendung der Streuspeicherfunktion ergebende Streuspei- 
cherwert einen ersten Abschnitt, der dazu dient, den Index- 
knoten zu identiflzieren, an den Daten fur die Speicherung 
gesendet werden sollen oder an den ein Merkmalsfragment 
als Muster zu senden ist Der Streuspeicherwert besitzt auch 
einen zweiten Abschnitt, der als lokaler Indexwert bezeich- 
net wird, und der dazu verwendet wird, um die Speicherpo- 
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sitionen zu bestimmen, an denen Daten zu speichern sind 
odcr von dcncn Datcn vom Indcxknotcn zu holcn sind. So- 
mit werden die streugespeicherten Objektmerkmalsfrag- 
mente (Schritt 202) als Muster an bestirnmte indexknoten 
106 des Data Warehouse verteilt, welche durch den ersten 
Abschnitt des streugespeicherten Wertes bestirnmt werden. 

Die Indexknoten 106, deren Muster mit den streugespei- 
cherten Mericmalsfragmenten iibereinstimmen, durch wel- 
che die Daten urspriinglich am Indexknoten gespeichert 
wurden, antworten auf eine Wiedergewinnungsrneldung 
durch die Obertragung (Schritt 203) der OEDs, welche den 
slreugespeicherten Merkmalsfraginenten der angeforderten 
Inforniationen entsprechen, zum Warehouse- Kno ten 108. 
Somit werden samtliche Obereinstimmungen zwischen den 
streugespeicherten Mustern und einer lokalen Streuspei- 
chertabelle der streugespeicherten Merkmalsfragmente zu- 
ruckgegeben oder am Warehouse-Knoten 108 gesammelt, 
der die Objektmerkmalsfragmente anfanglich streugespei- 
chert hat 

Der Warehouse-Knoten 108 bestimmt danach, ob eine der 
OJDs das selbe Objekt reprasentiert wie das im Warehouse 
zu verarbeitende Objekt Diese Bestimmung wird vom Wa- 
rehouse-Knoten diurch Vergleich des Ahnlichkeitsgrades 
zwischen dem im Warehouse zu verarbeitenden Objekt und 
den Objekten, deren OIDs zurtickgegeben wurden, durchge- 
fiihru In einer AusfUhrungsform wird das MaB der Ahnlich- 
keit durch die Merkmale bestimmt, die den Objekten ge- 
mein sind, und den Merkmalen des im Warehouse zu verar- 
beitenden Objekts, die keine Merkmale des Objekts sind, 
dessen OID zuriickgegeben wurde. 

Dieses AhnlichkeitsrnaB kann auf dem Merkmalskon- 
trastmodell von Tversky (Referenz oben) basieren. Der erste 
Term tragt eine positive Zahl zum Ahnlichkeitswert bei, 
wahrend der zweite einen negativen Beitrag leistet Dariiber 
hinaus wird der zweite Term mit einer vordefinierten Kon- 
stanten multipliziert, so daB ein Merkmal in der zweiten 
Ciruppe weniger Auswirkungen auf die Ahnlichkeit hat als 
eines in der ersten Gruppe. 

Wenn bestirnmt wird, daB das Objekt im Data Warehouse 
reprasentiert wird, dann sleht bereils eine OID fur das Ob- 
jekt bereit Wenn es noch nicht reprasentiert wird, wird eine 
einzigartige OID fur das Objekt ausgewahlt. 

Danach extrahiert der Warehouse-Knoten 108 alle Merk- 
male des Objekts gerhaB dem integrierten Datenmodell des 
Data Warehouse. Die Merkmalsextraktionstechniken wur- 
den oben diskutiert Der Warehouse-Knoten 108 fragmen- 
tiertdie einzelnen Merkmale in Merkmalsfragmente und co- 
dierte die einzelnen Merkmalsfragmente des Objekts durch 
Verwendung einer vordefinierten Streuspeicherfunktion, 
wie dies oben diskutiert wurde. In einer Ausfuhrungsforrn 
besitzt der Streuspeicherwert, der sich aus der Verwendung 
der Streuspeicherfunktion ergibt, einen ersten Abschnitt, der 
dazu dient, den Indexknoten zu identifizieren, zu dem die zu 
speichernden Daten gesendet werden sollen (Schritt 204), 
und einen zweiten Abschnitt, bei dem es sich um einen loka- 
len Indexwert handelt, der verwendet wird, um zu bestim- 
men, wo die Datcn am Indexknoten zu speichern sind 
(Schritt 205). 

Betrachten wir als nachstes ein beispielhaftes Verfahren 
300 fur die Verarbeitung einer Abfrage und nehmen wir 
dazu Bezug auf Fig. 3. Wenn in einer Ausfuhrungsforrn ein 
Anwender (Schritt 301) eine Abfrage vom Anwendercom- 
puter 102 ubertragt, empfangt der Front-End-Computer 104 
die Abfrage. Der Front-End-Computer 104 ist dafur verant- 
wortlich, die Verbindung mit dem Anwendercomputer 102 
aufzunehmen, um es dem Anwender zu ermSglichen, eine 
Abfrage zu ubertragen und eine Antwort in einem entspre- 
chenden Format zu empfangen. Der Front-End-Computer 



104 ist auch fur samtliche Authentifizierungs- und Verwal- 
tungsfunktioncn vcrantwortlich. In einer Ausfuhrungsforrn 
handelt es sich bei dem Front-End-Computer 104 um einen 
World Wide Web-Server, der mit dem Anwendercomputer 
5 102 iiber das HTTP-Protokoll kommuniziert. 

Nach der Oberprufung, ob die Abfrage akzeptabel ist, 
fuhrt der Front-End-Computer 104 alle Neuformatierungs- 
arbeiten durch, die notwendig sind, um die Abfrage mit den 
Anforderungen des Data Warehouse kompatibel zu machen. 

io Der Front-End-Computer 104 Ubertragt danach die Abfrage 
zu einem der Indexknoten 106 des Data Warehouse (Schritt 
302), der danach als Heiinknoten 107 des Data Warehouse 
fur diese Abfrage bezeichhet wird. 

Der Heiinknoten 107 zerlegt die Abfrage in eine Anzahl 

15 (eine oder mehrere) von Unterabfragen. Jede Unterabfrage 
besitzt ein Merkmal und spezifiziert ein vom Computer aus- 
fuhrbares Verfahren, z. B. eine Berechnung. Die Berech- 
nung bestirnmt, welche MaBnahme die Unterabfrage auszu- 
fuhren hat. Die haufigsten Berechnungen sind statistische 

20 Funktionen, die Informationen sammeln, welche im Data 
Warehouse gespeichert sind. Berechnungen konnen Ahn- 
lichkeiLskriterien wie zum Bei spiel die zur Akzeptierung ei- 
ner Obereirjsdmmung erforderliche Mindeststarke und stati- 
stische Berechnungen, wie zum Beispiel den Durchschnitt 

25 oder die Standardabweichung, umfassen. Die Berechnung 
kann zusatzliche Unterablragen umfassen. 

Fiir jede Unterabfrage fragmentiert der Heiinknoten 107 
das Unterabfragemerkmal in Unterabfragemerkmalsfrag- 
mente und codiert das Merkmalsfragment durch Verwen- 

30 dung einer vordefinierten Streuspeicherfunktion, wie dies 
oben beschrieben ist. Das streugespeicherte Fragment und 
die Unterabfrage werden unter Verwendung des streugespei- 
cherten Merkm als fragments wie oben beschrieben vom 
Heimknoten zu einem Indexknoten ubertragen (Schritt 303). 

35 Der Indexknoten 106, dessen streugespeicherte Frag- 
mente mit den Tndexmerkmalsfragmenten iibereinstimmen, 
durch welche die Daten anfanglich an jenem Indexknoten 
gespeichert wurden, reagieren auf die Unterabfragen, indem 
sie Daten in die lokale Streuspeichertabelle von Indexter- 

40 mini holen, welche mit dem slreugespeicherten Merkmals- 
fragment iibereinstimmen, und indem sie die in der Unterab- 
frage angegebene Berechnung durchfuhren. Wenn die Be- 
rechnung zusatzliche Unterabfragen enthalt, ubemimmt der 
Indexknoten die Funktion eines Heimknotens fiir eine neue 

45 Abfrage, die als Komponentenunterabfrage bezeichhet 
wird, welche wie oben beschrieben verarbeitet wird (Schritt 
304). Zum Beispiel konnte eine Unterabfrage verwendet 
werden, um andere Produktumsatze zu finden, die mit ein- 
zelnen Kunden im Zusammenhang stehen, welche im letz- 

50 ten Monat ein Gerat gekauft haben. Unabhangig davon, ob 
die Berechnung zusatzliche Unterabfragen enthalt oder 
nicht, gibt der Indexknoten die Ergebnisse seiner Berech- 
nung an den Heimknoten 107 der Unterabfrage zurilck, der 
sie erhallen hal (Schritt 305). 

55 Wenn die Ergebnisse aller Unterabfragen der urspriingli- 
chen Abfrage empfangen wurden, fuhrt der Heimknoten 107 
samtliche Datcnaggrcgationcn durch, wic zum Beispiel die 
Berechnung des Durchschnitts oder der Standardabwei- 
chung, die von der urspriinglichen Abfrage angegeben wur- 

60 den, und gibt die sich daraus ergebenden Informationen an 
den Anwender zuriick. In einer Ausfuhrungsforrn werden 
die zuriickgegebenen Informationen an den Front-End- 
Computer 104 ubertragen (Schritt 306), der die Antwort ent- 
sprechend formatiert und die Antwort an den Anwender 

65 ubertragt (Schritt 307). In einer anderen Ausfuhrungsforrn 
werden die zurtickzugebenden Informationen ohne Inter- 
vention des Front-End-Computers 104, z. B. iiber ein Netz- 
werk 105, direkt zum Anwendercomputer 102 ubertragen. 
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Als nachstes werden die in der bevorzugten Ausfuhrungs- 
forrn vcrwcndctcn Mcldungsformatc bcsprochcn und dabci 
auf Fig. 4a Bezug genornmen. Ein beispielhaftes Format fur 
eine Warehouse-Meldung urnfaBt vier Felden die Kopfzeile 
402, den Objektbezeichner (QID) 403, das streugespeicherte 
Objektfragment (HOF) 404, und den Wert 405. Das Kopf- 
zeilenfeld 402 gibt an, daB es sich bei dieser Meldung urn 
eine Warehouse-Meldung handelt, und es gibt auch den Be- 
stimmungsindexknoten an. Der Bestimmungsindexknoten 
wird vom ersten Abschnitt des streugespeicherten Objekt- 
fragments bestimmt Das OID-Feld 403 enthalt einen Ob- 
jektart-Spezifizierer und einen Objektbezeichner. Das HOF- 
Feld 404 enthalt einen Fragmentart-Spezinzierer und den 
zweiten Abschnitt des streugespeicherten Objektfragments, 
das vom Streuspeichermodul erzeugt wird (Fig. 5). Das 
Wert-Feld 405 enthalt einen wahlweisen Wert, der dem 
Fragment zugeordnet ist. Der Fragmentart-Spezifizierer be- 
stimmt, ob die Warehouse-Meldung ein Wert-Feld 405 ent- 
halt, und wenn die Warehouse-Meldung tatsachlich ein 
Wert-Feld enthalt, bestimmt der Fragmentart-Spezifizierer 
die GroBe des Wert-Feldes. 

Bezugnehmend auf Fig. 4b besitzt ein beispielhaftes For- 
mat einer Warehouse-Antwortmeldung zwei Teile: den Be- 
zeichner und Werte. Der Bezeichner-Teil besitzt vier Felden 
Kopfzeile 406, OID1 407, OID2 408, und Gewicht 409. Das 
Kopfzeilenfeld 406 gibt an, daB es sich bei dieser Meldung 
urn eine Warehouse-Antwortmeldung handelt, und es gibt 
auch den Warehouse-Bestimmungsknoten an. Der Ware- 
house-Bestimmungsknoten ist der Warehouse-Knoten, von 
dem die entsprechende Warehouse-Meldung empfangen 
wurde. Die beiden OID-Felder 407, 408 enthalten einen Ob- 
jektart-Spezifizierer und einen Objektbezeichner. Das erste 
OID-Feld 407 ist gleich wie das OID-Feld 403 der entspre- 
chenden Warehbuse-Meldung. Das zweite OID-Feld 408 
identifiziert ein Objekt, das zuvor indiziert wurde. Das Ge- 
wicht-Feld 409 enthalt ein option ales Gewicht, das dem Ob- 
jekt zugeordnet ist, welches durch OID1 407 identifiziert 
wird. Der Objektart-Spezinzierer von OID1 bestimmt, ob 
die Warehouse-Antwortmeldung ein Gewicht-Feld enthalt, 
und wenn die Warehouse- Abfrageantwortmeldung tatsach- 
lich ein Gewicht-Feld enthalt, bestimmt der Objektart-Spe- 
zifizierer von OID1 die GroBe des Feldes. Der Werte-Teil 
der Warehouse-Antwortmeldung enthalt eine Anzahl von 
Feldem 410, welche Daten enthalten, die dem von OID2 
408 identifizierten Objekt zugeordnet sind. Die Struktur und 
GroBe des Werte-Teiles wird vom Objekttyp-Speztfizierer 
von OID2 bestimmt 

Bezugnehmend auf Fig. 4c besitzt ein beispielhaftes For- 
mat fur eine Einfugemeldung vier Felden Kopfzeile 411, 
OTD 412, HOF 413, und Wert 414. Das Kopfzeilen-Feld 414 
gibt an, daB es sich bei dieser Meldung um eine Einfugemel- 
dung handelt, und es legt auch den Bestimmungsindexkno- 
ten fest. Der Bestimmungsindexknoten wird vom ersten Ab- 
schnitt des streugespeicherten Objektfragments bestimmt. 
Das OID-Feld 412 enthalt einen Objektart-Spezifizierer und 
einen Objektbezeichner. Das IIOF-Feld 413 enthalt einen 
Fragmcntart-Spezifizicrcr und den zweiten Abschnitt des 
streugespeicherten Objektfragments, das vom Streuspei- 
chermodul erzeugt wird (Fig. 5). Das Wert-Feld 414 enthalt 
einen wahlweisen Wert, der dem Fragment zugeordnet ist. 
Der Fragmentart-Spezinzierer bestimmt, ob die Einfuge- 
meldung ein Wert-Feld 414 enthalt, und wenn die Einfuge- 
meldung tatsachlich ein Wert-Feld enthalt, bestimmt der 
Fragmentart-Spezinzierer die GroBe des Wert-Feldes. 

Bezugnehmend auf Fig, 4d besitzt ein beispielhaftes For- 
mat einer Unterabfragemeldung zwei Teile: den Bezeichner 
und Unterabfragen. Der Bezeichner-Teil besitzt vier Felden 
die Kopfzeile 415, den Unterabfragebezeichner (QSID) 416, 
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das streugespeicherte Abfragefragment (IIQF) 417, und den 
Wert 418. Das Kopfzeilenfeld 415 gibt an, daB es sich bei 
dieser Meldung um eine Unterabfragemeldung handelt, und 
es gibt auch den Bestimmungsindexknoten an. Der Bestim- 
5 mungsindexknoten wird vom ersten Abschnitt des streuge- 
speicherten Abfragefragments bestimmt. Das QSID-Feid 
416 enthalt einen Abfjageart-Spezifizierer und einen Unter- 
abfragebezeichner. Das HQF-Feld 417 enthalt einen Frag- 
mentart-Spezinzierer und den zweiten Abschnitt des streu- 
io gespeicherten Unterabfragefragments, das vom Streuspei- 
chermodul erzeugt wird (Fig, 5). Das Wert-Feld 418 enthalt 
einen wahlweisen Wert, der dem Fragment zugeordnet ist. 
Der Fragmentart-Spezinzierer bestimmt, ob die Unterabfra- 
gemeldung ein Wert-Feld 418 enthalt, und wenn die Unter- 
15 abfrage-Meldung tatsachlich ein Wert-Feld enthalt, be- 
stimmt der Fragmentart-Spezinzierer die GroBe des Wert- 
Feldes. Der Unterabfragen-Teil der Unterabfragemeldung 
enthalt eine Anzahl an Unterabfragen. Eine Unterabfrage- 
meldung, welche keine Unterabfragen besitzt, wird als Ein- 
20 fache Unterabfragemeldung bezeichnet 

Bezugnehmend auf Fig. 4e besitzt eine beispielhafte Aus- 
fuhrungsforrn einer Unterabfrageantwortmeldung zwei 
Teile: den Bezeichner und Werte. Der Bezeichner-Teil be- 
sitzt zwei Felder: die Kopfzeile 420 und die QSID 421. Das 
25 Kopfzeilenfeld 420 gibt an, daB es sich bei dieser Meldung 
um eine Unterdbfrageantwortmeldung handelt, und es gibt 
auch den Bestimmungsindexknoten an. Der Bestimmungs- 
indexknoten ist der selbe wie der Indexknoten, von dem die 
entsprechende Unterabfragemeldung empfangen wurde. 
30 Das QSID-Feld 421 enthalt einen Abfrageart-Spezifizierer 
und einen Unterabfragebezeichner. Der Werte-Teil der Un- 
terabfrageantwortmeldung besitzt eine Anzahl an Feldem 
422, welche die Ergebnisdaten der Unterabfrage aufheh- 
men. Die Struktur des Werte-Teiles wird vom Abfrageart- 
35 Spezifizierer spezifiziert. 

Jeder Knoten des verteilten Computersy stems urnfaBt ein 
Kommunikationsmodul, das im folgenden diskutiert wird 
und in Fig. 5 und 6 dargestellt ist, und das fur das Obertra- 
gen und Empfangen von Meldungen zwischen zwei Knoten 
40 verantwortlich ist. Die "Qberlragung einer Meldung erf order! 
(1) das In-die-Warteschlange-Stellen der Meldung vor der 
Ubertragung iiber das Kbmmunikationsmedium, (2) die tat- 
sachliche Ubertragung iiber das Kommunikationsmedium, 
und (3) das In-die-Warteschlange-Stellen einer Auf gabe, um 
45 die Meldung zu verarbeiten, wenn die Meldung vom Modul 
empfangen wird, das von der Meldung s art bestimmt wird. 
Die Meldungsart bestimmt den Befehl, der an das empfan- 
gende Modul geschickt wird. Der Befehl bestimmt das Mit- 
tel, durch welches die Meldung vom Modul verarbeitet wer- 
50 den soil. Der Besrimmungsknoten fur eine zu iibertragende 
Meldung wird im Kopfzeilen-Feld einer jeden Meldung an- 
gegeben. Wenn eine Meldung von einem anderen Knoten 
empfangen wird, bestimmt die Art der Meldung* welches 
Modul die Meldung verarbeiten wird. Die Meldungsart wird 
55 im Kopfzeilen-Feld einer jeden Meldung angegeben. Das 
Kommunikationsmodul eines Ileimknotens ist auch fur die 
Kommunikation mit den Fron t- End- Knoten verantwortlich. 
Ein Front-End-Knoten ubertragt Abfragen zum Heimkno- 
ten, und der Heimknoten iibertragt die Ergebnisse, wie zum 
60 Beispiel Graphen und formatierte Tabellen, zum Front-End- 
Knoten. 

Als nachstes betrachten wir beispielhafte Ausfuhrungs- 
formen der oben diskutierten Knoten, wobei zu diesem 
Zweck auch auf Fig. 5 Bezug genornrnen wird. Ein Ware- 
65 house-Knoten 500 kann einen Downioader 502 besitzen, der 
externe Datenbanken abtastet, um Objekte fur die Ware- 
house- Verarbeitung und Indizierung durch die Wissensex- 
traktionsmaschine herunterzuladen. Jeder Warehouse-Kno- 
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ten 500 kann eine unterschiedliche Art eines Downloaders 
500 bcsitzcn. Zum Bcispicl kann cine Art cincs Downloa- 
ders Daten von relationalen Datenbanken mit Hilfe eines 
standardmaBigen SQI^Protokolls, wie zum Beispiel eines 
ODBC- oder eines proprietaren Protokolls, das von einern 5 
Anbieter relationaler Datenbanken festgelegt wurde, herun- 
terladen. Das Herunteriaden wird in diesem Fall mit Hilfe 
einer oder mehrerer SQT.-Abfragen durchgefuhrt Fur ein 
anderes Beispiel kann es sich bei dem Downloader um einen 
Informations- und Inhaltsaustauscbabonnenten (ICE) ban- 10 
delh, der verhandelt, um Inhalte von Syndikatoren iiber das 
Internet zu erbalten. Dies ist ein bevorzugter Mechanismus 
zum Erlangen von zeitkritischem Inhalt, wie zum Beispiel 
Nachrichten. Der Downloader 502 iibertragt Objekte zu ei- 
nern Merkmalsextraktor 504. ' 15 

Der Merkmalsextraktor 504 extrahiert Merkmale von ei- 
nern Objekt. Wenn es sich bei dem Objekt um einen Eintrag 
in einer relationalen Datenbank handelt, umfaBt die Merk- 
malsextraktion solche Schritte wie das Auswahlen der Fel- 
der, die zu indizieren sind, das Neuformatieren der Felder 20 
und das Eliminieren oder Korrigieren von Daten, die als feh- 
lerhaft bestimmt werden. Die Merkrnalsextraktion fur Bil- 
der wird durch Erkermung der Kanten, Identifizierung der 
Bildobjekte und Bestirnmung der Beziehungen zwischen 
Bildobjekten durchgefQhrt In einer anderen Ausfiihrungs- 25 
form wird die Mertaialsexlraklion fur Bilder durch Berech- 
nung der Fourier- und Wavelet-Transformationen durchge- 
fuhrt. Jede Fourier- oder Wavelet-Transformation stellt ein 
extrahiertes Merkmal dar. Merkmale werden mit Hilfe einer 
Anzahl an Einfugemeldungen indiziert. 30 

Der Merkmalsextraktor 504 bildet auch jeden Objektbe- . 
zeichner in einer extemen Datenbank an einen Objektidenti- 
fizierer der Wissensextraktionsmaschine ab. Jede exteme 
Datenbank kann ihren eigenen Mechanismus zur Zuweisung 
von Objektidentirizierern besitzen, und Merkmale des sel- 35 
ben Objekts konnen in jeder extemen Datenbank mit einern 
unterschiedlichen Objektidentifizierer gespeichert werden. 
Zum Beispiel kann eine exteme Datenbank eine Sozialversi- 
cherungsnummer verwenden. Eine andere Datenbank 
konnte eine Mitarbeiterkennung yerwenden. Die Abbildung 40 
von externen Objektidentifizierem wird durch Verwendung 
einer Anzahl von Warehouse- Meldungen erzielt. 

Ein Fragmentierer 506 berechnet die in den einzelnen 
Merkmalen enthaltenen Fragmente. Jedes Fragment besteht 
aus einer abgegrenzten Gruppe miteinander in Beziehung 45 
stehender Komponenten des Merkmals. In einer Ausfiih- 
rungsform umfassen die Fragmente eines Merkmals jedes 
Attribut und jede Beziehung in der Datenstruktur, welche 
das Merkmal definieren. Bei einern Objekt in der Form eines 
Hintrags einer relationalen Datenbank handelt es sich bei 50 
den Merkmalen um die Attribute, die vom Merkmalsex- 
traktor 504 ausgewahlt, neu formatiert und korrigiert wur- 
den. Die Fragmente werden zum Streuspeichermodul iiber- 
tragen. 

Ein Streuspeichermodul 508 berechnet eine Streuspei- 55 
cherfunktion eines Fragments. In einer Ausfuhrungsform 
handelt cs sich bei der Strcuspcichcrfunktion um den MD4 
Message Digest Algorithmus, der in einer Spezifikation, Re- 
quest for Comment (RFC) 1185, veroffentlicht von der Net- 
work Working Group der Internet Engineering Task Force, 60 
Oktober 1990, beschrieben ist, und iiber das Internet oder 
von R. Rivest am MIT Laboratory for Computer Science, 
Cambridge, MA, USA, erhaltlich ist Das Streuspeichermo- 
dul 508 iibertragt entweder eine Warehouse-Meldung oder 
eine Einfugemeldung zu einern Kommunikationsmodul 65 
510; dies hangt davon ab, ob der Zweck des Fragments darin 
besteht, eine Objektidentirizierer-Abbildung zu erzielen, 
oder ein Objektmerkmal zu indizieren. 
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Ein Ahnlichkeitskomparator 512 empfangt Warehouse- 
Antwortmcldungcn vom Kommunikationsmodul 510 und 
erzeugt Einfugemeldungen, die zum Kommunikationsmo- 
dul 510 iibertragen werden. Der Ahnlichkeitskomparator 
512 sammelt alle Warehouse-Antworten fiir ein Objekt, des- 
sen Bezeichner abgebildet wird. Fiir jedes Objekt in den 
Antworten bestimmt der Ahnlichkeitskomparator 512 die 
Relevanz eines jeden in der Suche zuriickgegehenen Objekt- 
bezeichners. Diese Bestirnmung der Releyanz wird vom 
Warehouse- Knoten durch Vergleich des Ahnlichkeitsgrades 
zwischen dem Objekt, dessen Bezeichner abgebildet wird, 
und den Objekten, deren OIDs zuriickgegeben wurden, 
durchgefuhrL In einer Ausfuhrungsform ist das MaB der 
Ahnlichkeit zwischen der Abfrage und dem Objekt ein Co- 
sinusmaB, das vom Ausdruck COS(v, w) angegeben wird, 
wobei der Vektor v die Abfrage bezeichnet, und der Vektor 
w das Objekt bezeichnet. Diese Vektoren befinden sich in ei- 
nern Raum, in dem jedes Fragment eine Dimension des Rau- 
mes reprasentiert. Wenn eine kompatible OID gefunden 
wird, wird die OID als abgebildeter Objektbezeichner ver- 
wendet, und die OID wird zum Merkmalsextraktor 504 
iibertragen. Wenn keine kompatible OTD gefunden wird, 
wird ein neuer Objektbezeichner ausgewahlt und zum 
Merkmalsextraktor 504 iibertragen. 

Bezugnehmend auf Fig. 6 kann ein Indexknoten 600 ein 
Fragmenttabellenmodul 602 besilzen, das Warehouse-Mel- 
dungen, Einfugemeldungen und Einfache Unterabfragemel- 
dungen von einern Kommunikationsmodul 604 empfangt. 
ImFalle einer Warehouse-Meldung holt das Fragmenttabel- 
lenmodul 602 einen Eintrag in eine lokale Streuspeicherta- 
belle 603, wofur der Streuspeicherwert im HOF-Feld ver- 
wendet wird. Der Arten-Spezifizierer im HOF-Feld und der 
Eintrag in der lokalen Streuspeichertabelle werden zu einern 
Fragmentkomparator 606 iibertragen. Im Falle einer Einfa- 
chen Unterabfrage-Meldung holt das Fragmenttabellenmo- 
dul 602 einen Hintrag in eine lokale Streuspeichertabelle 
603, wofur der Streuspeicherwert im HQF-Feld yerwendet 
wird. Der Eintrag in der lokalen Streuspeichertabelle 603 
wird mit Hilfe einer Unterabfrageantwortmeldung an einen 
Abfrageprozessor 608 zuriickgegeben. Im Falle einer Einf ii- 
gemeldung modifiziert das Fragmenttabellenmodul 602 ei- 
nen Eintrag in der lokalen Streuspeichertabelle 603 durch 
Einfiigung der OID- und Wert-Felder der Einfugemeldung 
in den Eintrag in der lokalen Streuspeichertabelle 603. 

Der Fragmentkomparator 606 empfangt Eintrage aus dem 
FragmenttabeUenmodul 602. Eine Vergleichsfunktion wird 
vom HOF-Arten-Spezifizierer bestimmt, der vom Frag- 
menttabellenmodul 602 iibertragen wurde. Die Vergleichs- 
funktion wird dazu verwendet, um die Relevanz der OED- 
und Wert-Felder im Eintrag zu bestimmen, der vom Frag- 
menttabellenmodul 602 iibertragen wurde. In einer Ausfuh- 
rungsform besdmmt die Vergleichsfunktion ein Ahnlich- 
keitsgewicht, und die OIDs mit dem hochsten Ahnlichkeits- 
gewicht werden als relevant erachtet. Die relevanten OIDs 
und deren Ahnlichkeitsgewichte werden mit Hilfe einer Wa- 
rehouse- Antwortmeldung zum Kommunikationsmodul 604 
iibertragen. 

Ein Abfrage-Parser 612 fiihrt ein Parsing an einer Ab- 
frage in einern Abfrageberechnungsbaum, der im Speicher 
613 gespeichert ist, durch, wobei es sich um eine Daten- 
struktur handelt, die hinsichtlich einer Anzahl an Knoten 
und ihrer Beziehungen zueinander spezifiziert ist Die Kno- 
ten der Abfrageberechnungsbaume sind entweder interne 
Knoten oder Blattknoten. Ein interner Knoten ist ein Knoten 
mit einern oder mehreren Tochterknoten Ein interner Kno- 
ten legt fest, wie die Ergebnisse der Tochterknoten zu kom- 
binieren sind. Zum Beispiel konnten die Summen summiert 
oder gemittelt oder. zur Berechnung der Standardabwei- 
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chung verwendet werden. Ein Blattknoten ist ein Knoten, 
dcr kcinc Tochtcrknotcn besitzt. Ein Blattknoten ist entwe- 
der ein konstanter Wert oder ein einf acher Unterabfragekno- 
ten. Ein Unterabfrageknoten kann eine Anzahl an Kompo- 
nenten-Unterabfrageh besitzen. Jede Komponenten-Unter- 5 
abfrage wird auch mit Hilfe eines entsprechenden Abfrage- 
berechnungsbaums spezifiziert Die Abfrageberechnungs- 
baume werden zum Abfrageprozessor 608 ubertragen. 

Der Abfrageprozessor 608 ist fiir die Verwaltung der Ver- 
arbeitung der Abfragen verantwortlich. Beim Empfang ei- 10 
nes Abfrageberechungsbaums vom Abfrage-Parser weist 
dieser der Abfrage einen Abfragebezeichner (QID) zii, und 
er weist auch jedem Blattknoten, der eine Unterabfrage spe- 
zifiziert, einen Unterabfragebezeichner (QSID) zu. Eine Un- 
terabfirage, die keine Komponentenunterabfragen besitzt, 15 
wird als Einfache Unterabfrage bezeichnet. Eine Unterab- 
frage wird verarbeitet, indem eine Unterabfragemeldung 
mittels des Kommunikationsrnoduls 604 zum spezifizierten 
Indexknoten ubertragen wird. Der Abfrageprozessor 608 
verarbeitet an dern spezifizierten Bestimmungsknoten die 20 
Unterabfragemeldung durch Ubertragung einer Einfachen 
Unterabfragemeldung zum Fragmenttabellenmodul 602, 
das mit einer Unterabfxageantwortmeldung reagierL Der 
Abfrageprozessor 608 sendet danach die Unterabfirageant- 
wortmeldung zum Indexknoten, der urspriinglich die Unter- 25 
abfrageineldung geschickt haL Als Ergebnis sendet und 
empfangt der Abfrageprozessor 608 Unterabfragemeldun- 
gen und Unterabfrageantwortmeldungen. Wenn Unterabfra- 
geantwortmeldungen empfangen werden, wird die im Ab- 
frageberechnungsbaum spezifizierte Verarbeitung durchge- 30 
fuhrt. Wenn eine Unterabfrage eine Komponentenunterab- 
frage besitzt, fordert die Unterabfrage die Verarbeitung zu- 
satzlicher Unterabfragen an. Wenn die gesamte Abfrage 
(einschlieBlich aller ihrer Unterabfragen und deren Unterab- 
fragen, usw., die als "verschachtelte Unterabfragen" be- 35 
zeichnet werden) berechnet wurde,. werden die Hi^gebnisse 
formatiert und zum Front-End-Rechner ubertragen, von 
dem die Abfrage erhalten wurde. Zum Beispiel konnen die 
Ergebnisse als Graph oder Tabelle angegeben werden. Da 
jede Abfrage oder verschachtelte Unterabfrage einer Ebene 40 
innerhalb des Baumes zugeordnet ist, ist der Abfrageprozes- 
sor 608 demgemaB fur die Verarbeitung von Abfragen aller 
Ebenen innerhalb des Baumes verantwortlich. . 

Fig. 7 zeigt eine herkommliche Systemarchitektur fiir eiri 
beispielhaftes Computersystem 800. Jeder der Anwender- 45 
computer, Front-End-Computer und der Computer-Knoten 
einschliefllich den Indizier- und Warehouse-Knoten kann als 
eine Instanz des Computersystems 800 implementiert wer- 
den. Das beispielhafte Computersystem von Fig. 7 wird je- 
doch ausschlieBlich fur beschreibende Zwecke diskutiert 50 
und sollte nicht als Einschrankung der Erfindung betrachtet 
werden. Wenngleich sich die folgende Beschreibung auf Be- 
griffe beziehen kann, die allgemein zur Beschreibung be- 
slimmter Coinpulersysteiiie verwendet werden, gelten die 
beschriebenen Konzepte gleichermafien auch fiir andere 55 
Computersysteme, einschlieBlich Systeme, deren Architek- 
tur jener unahnlich ist, die in Fig. 7 dargcstcllt ist 

Das Computersystem 800 umfaBt eine zentrale Rechen- 
einheit (CPU) 805, die einen herkomrnlichen Mikroprozes- 
sor enthalten kann, einen Direktzugriffsspeicher (RAM) 810 60 
zum temporaren Speichem von Informationen, und einen 
Nur-Lesen-Speicher (ROM) 815 fur die dauerhafte Speiche- 
rung von Informationen. Eine Speichersteuerung 820 ist 
vorhanden, welche den System-RAM 810 steuert. Eine Bus- 
steuerung 825 ist vorhanden, um den Bus 830 zu steuem, 65 
und eine Unterbrechungssfeuerung 835 wird verwendet, um 
verschiedene Unterbrechungssignale von anderen System- 
komponenten zu empfangen und zu verarbeiten. 



Ein Massenspeicher kann durch Diskette 842, CD-ROM 
847 oder Fcstplattc 852 zur Vcrfugung gcstcllt werden. Da- 
ten und Software konnen mit einem Client-Computer 800 
iiber austauschbare Medien, wie zum Beispiel Diskette 842 
und CD-ROM 847, ausgetauscht werden. Die Diskette 842 
kann in das Diskettenlaufwerk 841 eingefuhrt werden, wel- 
ches durch den Controller 840 mit dem Bus 830 verbunden 
ist Auf ahnliche Weise kann die CD-ROM 847 in das CD- 
ROM-Laufwerk 846 eingefuhrt werden, welches durch den 
Controller 845 mit dem Bus 830 verbunden ist. Schliefilich 
ist die Festplatte 852 Teil eines Festplattenlaufwerks 851, 
das vom Controller 850 mit dem Bus 830 verbunden wird. 

Die Benutzereingabe in das Computersystem 800 kann 
durch eine Anzahl unterschiedlicher Gerate erfolgen. Zum 
Beispiel konnen eine Tastatur 856 und eine Maus 857 iiber 
einen Tastatur- und Maus-Controller 855 mit dem Bus 830 
verbunden sein. Ein Audiowandler 896, der sowohl als Mi- 
krofon als auch als Lautsprecher dienen kann, wird vom Au- 
dio-Controller 897 mit dem Bus 830 verbunden. Fiir Fach- 
leute dieses Bereiches sollte leicht erkennbar sein, daB auch 
andere Eingabevorrichtungen, wie zum Beispiel ein Stift 
und/oder ein Tablett, oder ein Mikrofon fur die Sprachein- 
gabe, iiber den Bus 830 und einen entsprechenden Control- 
ler am Client-Computer 800 angeschlossen werden konnen. 
Ein DMA-Controller 860 1st vorhanden, um direkten Spei- 
cherzugrilT auf den System-RAM 810 zu ermoglichen. Eine 
Sichtanzeige wird von einem Video-Controller 865 erzeugt, 
der den Monitor 870 steuert. 

Das Computersystem 800 umfaBt auch einen Netzwerk- 
adapter 890, der es dem Client-Computer ermoglicht, iiber 
einen Bus 891 mit einem Netzwerk 895 verbunden zu wer- 
den. Das Netzwerk 895, bei dem es sich um ein lokales 
Netzwerk (LAN), ein Weitverkehrsnetz (WAN) oder das In- 
ternet handeln kann, kann Allzweck-Kornmunikationsiei- 
tungen verwenden, welche menrere Netzwerkgerate mitein- 
ander verbinden. 

Das C^omputersystem 800 wird im allgemeinen von einer 
Bettiebssystemsoftware gesteuert und koordiniert Zusatz- 
lich zu anderen Computersystemkontrollfunkdonen steuert 
das Betriebssysteiii auch die Zuordnung der Systemressour- 
cen und die Ausfuhrung von Aufgaben, wie zum Beispiel 
die Rechenzeitvergabe, die Speicherverwaltung sowie die 
Netzwerk- und Eingabe-/Ausgabedienste. 

Eine Software-Implementierung von Komponenten der 
oben beschriebenen Ausfuhrungsform kann Computeran- 
weisungen und Computerroutinen umf assen, die sich entwe- 
der auf einem beriihrbaren Medium, wie zum einem c compu- 
ter lesbaren Medium, z. B. der Diskette 842, der CD-ROM 
847, im ROM 815, oder der Festplatte .852 von Fig. 7 befin- 
den, oder die iiber ein Modem oder ein anderes Schnittstel- 
lengerat, wie zum Beispiel den Kommunikadonsadapter 
890, der am Netzwerk 895 angeschlossen ist, tiber ein Me- 
dium 891 ubertragen werden. Bei dem Medium 891 kann es 
sich enlweder um ein beriihrbares Medium handeln* wobei 
es sich unter anderem auch um optische oder hartverdrahtete 
Kommunikationsleitungen handeln kann, oder welches mit 
drahdoscn Tcchnikcn implementiert sein kann, wozu unter 
anderem Mikrowellen-, Infrarot- oder andere tJbertragungs- 
techniken zahlen. Es kann sich dabei auch um das Internet 
handeln. Bei einer derartigen "Obertraguhg konnen die Soft- 
warekomponenten die Form eines digitalen Signals anneh- 
men, das sich in einer Tragerwelle befindet. Eine Reihe von 
Computerbefehlen enthalt alle oder einige der Funktionen, 
die zuvor im Hinblick auf die Erfindung beschrieben wur- 
den. Fachleute dieses Bereichs werden anerkennen, daB sol- 
che Computeranweisungen in einer Vielzahl von Program- 
miersprachen geschrieben und in zahlreichen Computerar- 
chitekturen oder Betriebssystemen verwendet werden kon- 
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nen. Weiter konnen solche Anweisungen mit Ililfe jeder be- 
licbigcn zukunftigcn odcr gcgcnwartigcn Spcichcrtcchnolo- 
gie gespeichert werden, wobei unter anderem Halbleiter-, 
magnetische, optische oder andere Speichervorrichtungen 
zu erwahnen sind, oder mit Hilfe einer beliebigen gegenwar- 5 
tigen oder zukunftigen Kommunikationstechnologie iiber- 
tragen werden konnen, wobei unter anderern optische, Infra- 
rot-, Mikrowellen- oder andere Obertragungs technology en 
zu erwahnen sind. Es wird auch iiberlegt, ein solches Com- 
puterprograinin als entfernbares Medium mit einer beglei- 10 
tenden gedruckten oder elektronischen Dokumentation zu 
verteilen, z. B. als in Schruniplhiille verpackle Software, 
vorinstalliert auf einem Computersystem, z. B. auf ein em 
System-ROM oder auf Festplatte, oder verteilt von einem 
Server oder einem elektronischen Mailboxsystem iiber ein 15 
Netzwerk, z. B. dem Internet oder dem World Wide Web. 

Wenngleich eine beispieltiafte Ausfuhrungsform der Er- 
findung offenbart wurde, ist es fur Fachleute dieses Berei- 
ches leicht ersichtlich, dafi verschiedene Anderungen und 
Modifizierungen durchgefuhrt werden konnen, welche ei- 20 
nige der Vorteile der Erfindung mit sich bringen, ohne da- 
durch von Geist und Umfang der Hrfindung abzuweichen. 
Fur Fachleute dieses Bereiches ist es weiter offensichtlich, 
daB andere Komponenten, welche die selben Funktionen 
austiben, anstelle der hier genannten verwendet werden k6n- 25 
nen. Weiter konnen die Methoden der Erfindung enlweder in 
ausschlieBlichen Softwareimplementationen mit Hilfe der 
entsprechenden Prozessoranweisungen oder in Ilybridim- 
plementationen umgesetzt werden, welche eine Kombina- 
tion aus Hardware-Logik und Software-Logik verwenden, 30 
um die selben Ergebnisse zu erzielen. Weitere Aspekte, wie 
zum Beispiel die SpeichergroBe, die spezifische Konfigura- 
tion der zur Erzielung einer bestimmten Funktion notwendi- 
gen Logik und/oder Anweisungen, sowie andere Modifizie- 
rungen am erfinderischen Konzept sollen von den ange- 35 
hangten Anspriichen abgedeckt werden. Daher sollte die Er- 
findung nur insofem als eingeschrankt betrachtet werden, 
als dies durch den Umfang der Anspruche angezeigt wird. 

Palenlanspruche 40 

1. Verfahren zur Warehouse- Verarbeitung von Objek- 
ten oder Positionen von Objekten auf eine Art und 
Weise, die der Wissensextraktion mit Hilfe von Abfra- 
gen in einem verteilten Computer-Datenbanksystem 45 
mit einer Vielzahl an Indexknoten und einer Vielzahl 
an Warehouse-Knoten dienlich ist, die iiber ein Netz- 
werk miteinander verbunden sind, wobei das Verfahren 
die foigenden Schritte umfaBt: 

A) das Extrahieren einer ersten Anzahl an Merk- 50 
malen aus einem Objekt, das von einer anderen 
Datenbank heruntergeladen wurde, durch einen 
Warehouse-Knoten; 

B) das Fragmentieren der einzelnen exlrahierten 
Objektmerkmale in eine Anzahl von Objektmerk- 55 
malsfragmenten; 

C) das Strcuspcichcrn der cinzclncn Objcktmcrk- 
malsfragmente der ersten Anzahl an Objektmerk- 
malen durch den Warehouse-Knoten, wobei jedes 
der streugespeicherten Objektmerkmalsfragmente 60 
einen ersten Abschnitt und einen zweiten Ab- 
schnitt besitzt; 

D) das Ubertragen der einzelnen streugespeicher- 
ten Objektrnerkmalsf ragmen te der ersten Anzahl 

an Merkmalsfragmenten durch den Warehouse- 65 
Knoten zu einem jeweiligen der 'Vielzahl an In- 
dexknoten, die vom ersten Abschnitt des jeweili- 
gen streugespeicherten Objektmerkmals angege- 
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ben werden; 

E) das Vcrwcndcn des zweiten Abschnitts des je- 
weiligen streugespeicherten Objektmerkmalsfrag- 
ments durch den Indexknoten, um auf Daten ge- 
maB einer lokalen Streuspeichertabelle, die sich 
am Indexknoten befindet, zuzugreifen; 

F) das Zuriickgeben einer Anzahl an Objekt-Be- 
zeichnern, welche den Daten, auf die zugegriffen 
wurde, entsprechen, an den Warehouse-Knoten 
durch die einzelnen Indexknoten, welche auf Da- 
ten gemaB dem jeweiligen streugespeicherten Ob- 
jektmerkmalsIraguLent zugreifen; 

G) das Bestimmen durch den Warehouse-Knoten, 
ob das Objekt einem Objektbezeichner aus der 
Anzahl der Objektbezeichner zuzuordnen ist, oder 
ob das Objekt einem Objektbezeichner zuzuord- 
nen ist, der noch nicht in Verwendung steht; 

H) das Zuordnen eines Objektbezeichners zum 
Objekt gemaB der Bestimmung durch den Ware- 
house-ICnoten; 

I) das Extrahieren einer zweiten Anzahl an Merk- 
malen aus dem Objekt durch den Warehouse- 
Knoten; 

J) das Fragmentieren der extrahierten zweiten 
Anzahl an Objektmerkmalen in eine Anzahl an 
Objektmerkinalsfraginenten; 
K) das Streuspeichern der einzelnen Objektmerk- 
malsfragmente der zweiten Anzahl an Objekt- 
merkmalen durch den Warehouse-Knoten, wobei 
das streugespeicherte Objektmerkmalsfragment 
einen ersten Abschnitt und einen zweiten Ab- 
schnitt besitzt; 

L) das tTbertragen der einzelnen streugespeicher- 
ten Objektmerkmalsfragmente der zweiten An- 
zahl an Merkmalsfragmenten durch den Ware- 
house-Knoten zu einem jeweiligen der Vielzahl an 
Indexknoten, die vom ersten Abschnitt des jewei- 
ligen streugespeicherten Objektmerkmalfrag- 
ments angegeben werden; und 
M) das Verwenden des zweiten Abschnitts des je- 
weiligen streugespeicherten Objektmerkmalsfrag- 
ments durch den Indexknoten, um Daten gemaB 
einer lokalen Streuspeichertabelle, die sich am In- 
dexknoten befindet, zu speichern. 

2. Verfahren nach Anspruch 1, weiter umfassend den 
Schritt des Bestimmens eines MaBes der Ahnlichkeit 
durch den Warehouse-Knoten zwischen den Daten, auf 
die zugegrifTen wird, und dem Objekt, nachdem der 
Schritt der Riickgabe der ersten Anzahl an Objektbe- 
zeichnem ausgefuhrt wurde. 

3. Verfahren nach Anspruch 2, wobei das MaB der 
Ahnlichkeit besdmmt wird durch eine Ahnlichkeits- 
funktion, die auf Merkmalen basiert, welche sowohl 
den Daten, auf die zugegrilTen wird, als auch dem Ob- 
jekt eigen sind, und Merkmalen, die nur dem Objekt ei- 
gen sind. 

4. Verfahren zur Durchfuhrung von Data Mining- Akti- 
vitaten unter Verwendung von Abfragen in einem ver- 
teilten Computer-Datenbanksystem mit einer Anzahl 
an Indexknoten, die mit einem Netzwerk verbunden 
sind, wobei das Verfahren die foigenden Schritte um- 
faBt 

A) das Auswahlen eines ersten aus der Anzahl an 
Tndexknoten, der im foigenden als Heimknoten 
der Abfrage bezeichnet wird; 

B) das Extrahieren einer Anzahl an Unterabfra- 
gen durch den Heimknoten aus einer Abfrage 
durch einen Anwender, wobei jede Unterabfrage 
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ein Merkmal, eine Anzahl von Unterabfragen und 
cine Bcrcchnungsspczifizicrung umfaBt; 
O das Fragmentieren der einzelnen Unterabfra- 
gemerkmale in eine Anzahl an Unterabfragemerk- 
malsfragmente; 5 

D) das Streuspeichern durcb den Heimknoten der 
einzelnen Unterabfragemerkmalsfragmente der 
einzelnen Unterabfragemerkmalsfragmente, wo- 
bei jedes der streugespeicherten Unterabfrage- 
merkmalsfragmente einen ersten Abschnitt und io 
einen zweiten Abschnitt besitzt; 

E) das Obertragen der einzelnen slreugespeicher- 
ten Unterabfragemerkmalsfragmente durch den 
Heimknoten zu einem jeweiligen der Anzahl an 
Indexknoten, die vom ersten Abschnitt der einzel- 15 
nen streugespeicherten Unterabfragemerkmals- 
fragmente angegeben werden; 

F) das Verwenden des zweiten Abschnitts des je- 
weiligen streugespeicherten Unterabfragemerk- 
malsfragments durch den Indexknoten, um auf 20 
Daten gemaB einer lokalen Streuspeichertabelle, 
die sich am Indexknoten befindet, zuzugreifen; 

G) das rekursive Evaluieren der einzelnen Unter- 
abfragen der Anzahl an Unterabfragen, die in der 
jeweiligen Unterabfrage enthalten sind, welche 25 
vom Heimknoten uberlragen wurde, durch den In- 
dexknoten, wobei der Indexknoten als Heimkno- 
ten der Unterabfrage der Anzahl an Unterabfragen 
fungiert; 

H) das Berechnen der Informationen gemaB der 30 
Berechnungsspezifikation der jeweiligen vom 
Heimknoten ubertragenen Unterabfrage durch 
den Indexknoten gemaB den Daten, auf die zuge- 
griffen wurde, und den Informationen, die durch 
die rekursive Evaluierung der einzelnen Unterab- 35 
fragen der Anzahl an Unterabfragen bestimmt 
werden, die in der jeweiligen vom Heimknoten 
Ubertragenen Unterabfrage enthalten sind; 

I) das Zuruckgeben der Informationen zum 1 
Heimknoten durch den jeweiligen Indexknoten. 40 

5. Verfahren nach Anspruch 4, weiter umfassend den 
Schritt des Empfangens der Abfrage vom Anwender 
am Heimknoten vor dem Schritt des Extrahierens von 
Unterabfragen aus der Abfrage. 

6. Verteiltes Computer-Datenbanksystern fur das Wa- 45 
rehousing von Informationsobjekten oder Positionen 
von Informationsobjekten, umfassend: 

A) eine Anzahl an Warehouse- Knoten (108) und 
eine Anzahl an Indexknoten (106), wobei die An- 
zahl an Warehouse- Knoten und die Anzahl an In- 50 
dexknoten durch ein Netzwerk (110) miteinander 
verbunden sind; 

B) wobei jeder Warehouse-Knoteri (108) beim 
Herunterladen eines Objekts eine erste Anzahl an 
Merkmalen aus dem Objekt extrahiert, jedes der 55 
Objektmerkrnale in ein Objektmerkmalfragment 
fragmcnticrt, jedes der Objcktmcrkmalsfragmcntc 

in ein streugespeichertes Objektmerkmalsfrag- 
ment mit einem ersten Abschnitt und einem zwei- 
ten Abschnitt streuspeichert, und jedes der streu- 60 
gespeicherten Objektmerkmalsfragmente zu ei- 
nem jeweiligen der Anzahl an Indexknoten (106) 
ubertragt, der vom ersten Abschnitt des streuge- 
speicherten Objektmerkmalsfragments angegeben 
wird; 65 
Q wobei jeder der Indexknoten (106) den zwei- 
ten Abschnitt des streugespeicherten Abfrage- 
merkmalfragments verwendet, um auf die Daten 



gemaB einer lokalen Streuspeichertabelle zuzu- 
greifen, die sich am Indexknoten befindet, und 
eine Vielzahl an Objekt-Bezeichnern, welche den 
Daten, auf die zugegriffen wurde, entsprechen, an 
den Warehouse- Knoten (108) zuruckgibt; 

D) wobei das Warehouse dem Objekt entweder 
einen der Objektbezeichner der Anzahl an Objekt- 
bezeichnem oder einen noch nicht verwendeten 
Objektbezeichner zuordnet, eine zweite Anzahl an 
Merkmalen aus dem Objekt extrahiert, jedes der 
extrahierten Merkmale der zweiten Anzahl an 
Fragmenten in eine Anzahl an ObjekUnerkmals- 
fragmenten extrahiert; jedes der Objektmerkmals- 
fragmente der zweiten Anzahl an Objektmerkma- 
len in ein streugespeichertes Objektmerkmal mit 
einem ersten und zweiten Abschnitt streuspei- 
chert, und jedes der streugespeicherten Objekt- 
merkmalsfragmente zu einem jeweiligen der An- 
zahl an Indexknoten iibertragt, der vom ersten Ab- 
schnitt des streugespeicherten Objektmerkmal- 
fragments angegeben wird; 

E) wobei jeder Indexknoten den zweiten Ab- 
schnitt des jeweiligen streugespeicherten Objekt- 
merkmalsfragments verwendet, um die Objekte 
oder Positionen der Objekte gemaB einer lokalen 
Slreuspeichertabelle, die sich am Indexknoten be- 
findet, zu speichera. 

7. Verteiltes Computer-Datenbanksystern nach An- 
spruch 6, wobei der Warehouse- Knoten ein MaB der 
Ahnlichkeit zwischen den Daten, auf die zugegriffen 
wird, und dem Objekt bestimmt, um dem Objekt einen 
Objektbezeichner zuzuordnen. 

8. Verfahren nach Anspruch 7, wobei der Warehouse- 
Knoten die Ahnlichkeit mit Hilfe einer Ahnlichkeits- 
funktion mifit, die von Merkmalen bestimmt wird, wel- 
che sowohl -den Daten, auf die zugegriffen wird, als 
auch dem Objekt eigen sind; und Merkmalen, die nur 
dem Objekt eigen sind. 

9. Verteiltes Computer-Datenbanksystern mit einem 
Data Mining- Werkzeug Fur die Handhabung von Ab- 
fragen von einem Anwender, umfassend: 

A) eine Anzahl Indexknoten (106), die iiber ein 
Netzwerk (110) miteinander verbunden sind; 

B) wobei jeder der Indexknoten bei Empfang ei- 
ner Abfrage von einem Anwender, woraufhin er 
als Heimknoten der Abfrage bezeichnet wird, eine 
Anzahl an Unterabfragen von der Abfrage und 
eine Anzahl an Merkmalen von jeder Unterab- 
frage extrahiert, jedes der Unterabfragemerkmale 
in eine Anzahl an Unterabfragemerkmalsfrag- 
mente fragmentiert, das Unterab fragemerkmal der 
Anzahl an Unterabfragen in ein streugespeicher- 
tes Unterabfragemerkmal mit einem ersten und ei- 
nem zweiten Abschnitt streuspeichert, und jedes 
der streugespeicherten Unterabfragemerkmals- 
fragmente zu einem jeweiligen der Anzahl an In- 
dexknoten iibertragt, der vom ersten Abschnitt des 
streugespeicherten Unterabfragemerkmalsfrag- 
ments angegeben wird; 

O wobei weiter jeder der Indexknoten den zwei- 
ten Abschnitt des streugespeicherten Unterabfra- 
gemerkmalsf ra grnents verwendet, um auf Daten 
gemaB einer lokalen Streuspeichertabelle zuruck- 
zugreifen, die sich am Indexknoten befindet, jede 
Unterabfrage, die in der jeweiligen Unterabfrage 
enthalten ist, rekursiv evaluiert, die Informationen 
gemaB den Daten, auf die zugegriffen wird, und 
den Informationen, die von der rekursiven Evalu- 
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ierung bestimint werden, berechnet, und die Infor- 
mational an den Hcimknotcn zuriickgibt 
10. Verteiltes Computer-Datenbanksystem fur das Wa- 
rehousing und Data Minin gs umfassend: 

A) eine Anzahl Warehouse-Knoten (108) und 5 
eine Anzahl an Indexknoten (106), wobei die An- 
zahl an Warehouse-Knoten und die Anz ahl an In- 
dexknoten durch ein Netzwerk miteinander ver- 
bunden sind; 

B) wobei jeder der Warehouse-Knoten bei Emp- io 
fang eines Download-Befehis eine vorherbe- 
sliininte Aufgabe als Reaktion auf den Download- 
Befehl in eine Warteschlange stellt; 

Q eine als Reaktion auf einen Download-Befehl 
in eine Warteschlange gestellte Download- Auf- 15 
gabe eine erste Anzahl an Merkmalen aus einem 
Objekt extrahiert, das vom Download-Befehl her- 
untergeladen wurde, jedes der Objektmerkmale in 
eine Anzahl an Objektmerkmalsfragmenten frag- 
mentiert, jedes der Obj ektmerkmalsf ragmen te der 20 
ersten Anzahl an Objektmerkmalen in ein streuge- 
speichertes Objekrmerkmalsfragment init einem 
ersten Abschnitt und einem zweiten Abschnitt 
streuspeichert, und eine Antwortmeldung, welche 
jedes der streugespeicherten Objektmerkmals- 25 
fragment© enthall, zu einem jeweiligen der An- 
zahl an Indexknoten ubertragt, der vom ersten Ab- 
schnitt des streugespeicherten Objektmerkmals- 
fragments angegeben wird; 

D) wobei der Indexknoten bei Empfang der ge- 30 
holten Meldung den zweiten Abschnitts des streu- 
gespeicherten Objektmerkmalsfragments verwen- 
det, um auf die Daten gemaB einer lokalen Streu- 
speichertabelle zuzugreifen, die sich am Index- 
knoten befindet, und eine Meldung an den Ware- 35 
house-Knoten iibertragt, worin er eine Anzahl an 
Objektbezeichnern entsprechend den Daten, auf 
die zugegrifTen wurde, zuriickgibt; 

E) wobei der Warehouse-Knoten bei Empfang 
der Anzahl an Objektbezeichnern von der Anzahl 40 
an Indexknoten dem Objekt entweder einen der 
Objektbezeichner aus der Anzahl an Objektbe- 
zeichnern oder einen noch nicht verwendeten Ob- 
jektbezeichner zuordnet, eine zweite Anzahl an 
Merkmalen aus dem Objekt extrahiert, jedes der 45 
Objektmerkmale der zweiten Anzahl an Objekt- 
merkmalen in eine Anzahl an Objektmerkmals- 
fragmenten fragmentiert; jedes der Objektmerk- 
malsfragmente der zweiten Anzahl an Objekt- 
merkmalsfragmenten in ein streugespeichertes 50 
Objektmerkmalsfragment mit. einem ersten und 
einem zweiten Abschnitt fragmentiert, und eine 
Einftigemeldung, die jedes der streugespeicherten 
ObjekLmerkmalsfragmente enthalt, zu einem je- 
weiligen der Anzahl an Indexknoten iibertragt, der 55 
vom ersten Abschnitt des streugespeicherten Ob- 
jektmerkmalsfragments angegeben wird; 

F) wobei der Indexknoten bei Empfang der Ein- 
fiigemeldung den zweiten Abschnitt des streuge- 
speicherten Objektmerkmalsfragments verwen- 60 
det, um Daten gemaB einer lokalen Streuspeicher- 
tabelle, die sich am Indexknoten befindet, zu spei- 
chem. 

11. Verteiltes Computer-Datenbanksystem nach An- 
spruch 10, wobei der Warehouse-Knoten (108) in MaB 65 
der Ahnlichkeit zwischen den Daten, auf die zugegrif- 
fen wird, und dem Objekt bestimmt, um dem Objekt ei- 
nen Objektbezeichner zuzuordnen. 
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12. Verfahren nach Anspruch 11, wobei der Ware- 
house-Knoten die Ahnlichkeit mit Hilfc einer Ahnlich- 
keitsfunktion mifit, die bestimmt wird durch: Merk- 
male, die sowohl den Daten, auf die zugegrifTen wird, 
als auch dem Objekt eigen sind, und Merkmalen, die 
nur dem Objekt eigen sind. 

13. Verteiltes Computer-Datenbanksystem mit einem 
Data Mining-Werkzeug fur die Handhabung von Ab- 
fragen von einem Anwender, umfassend: 

A) eine Anzahl an Indexknoten (106), die iiber 
ein Netzwerk (108)miteinander verbunden sind; 

B) wobei jeder Indexknoten bei Empfang eines 
Befehls von einem Anwender - wobei dieser In- 
dexknoten als Heimknoten (107) des Befehls be- 
zeichnet wird - eine vorherbestimmte Aufgabe als 
Reaktion auf den Befehl in eine Warteschlange 
stellt; 

Q eine in eine Warteschlange gestellte Abfrage- 
aufgabe dazu fuhrt, daB als Reaktion auf einen 
Abfragebefehl vom Anwender eine Anzahl an 
Unterabfragen von einer Abfrage, die im Abfrage- 
befehl enthalten ist, und eine Anzahl an Merkma- 
len aus jeder der extrahierten Unterabfragen extra- 
hiert wird, jedes der Unterabfragernerkmale in 
eine Anzahl an Unterabfragemerkmalsfragmente 
fragmentiert wird, jedes der Unterabfragemerk- 
malsfragmente in ein streugespeichertes Unterab- 
fragefragment mit einem ersten Abschnitt und ei- 
nem zweiten Abschnitt streugespeichert wird, und 
eine Unterabfragemeldung, welche jedes der 
streugespeicherten Unterabfragefragmente ent- 
halt, zu einem jeweiligen der Anzahl an Index- 
knoten ubertragen wird, der vom ersten Abschnitt 
des streugespeicherten Unterabfragemerkmals- 
fragments angegeben wird; 

D) wobei der Indexknoten bei Rrhpfang der Un- 
terabfragemeldung den zweiten Abschnitt des 
streugespeicherten Unterabfragemerkmalsfrag- 
ments verwendet, um auf Daten gemaB einer loka- 
len Streuspeichertabelle zuzugreifen, die iin In- 
dexknoten vorhanden ist, jede Unterabfrage, die 
in der jeweiligen Unterabfrage vorhanden ist, re- 
kursiv evaluiert, die Informationen gemaB den 
Daten, auf die zugegrifTen wurde, und den Infor- 
mationen, die durch die rekursive Evaluierung be- 
stimmt wurden, berechnet, und eine Meldung 
iibertragt, in der die Informationen zum Heimkno- 
ten zuriickgegeben werden. 

14. Verfahren nach Anspruch 13, wobei die Abfrage- 
meldung vorherbestimmte Daten vom Indexknoten als 
Reaktion auf eine Abfrage anfordert, die im Abfrage- 
befehl des Anwenders enthalten ist. 

15. Informadonswiedergewinnungsvorrichtung fur die 
Verarbeitung einer Abfrage zur Wiedergewinnung von 
Informationen aus einer Datenbank, umfassend: 

A) einen Mechanismus zur Auffindung einer An- 
zahl an Merkmalen und Mcrkmalsf ragmen ten in 
einem Index; 

B) einen Evaluierungsmechanismus, gekoppelt 
mit dem Aufrindungsmechanisrnus, der eine An- 
zahl an Unterabfragen einer Anzahl an Ebenen 
identifiziert, die in der Abfrage enthalten sind, und 
die Unterabfragen mit Hilfe der gefundenen 
Merkmale undMerkmalsfragmente evaluiert; und 

C) einen Mechanismus, gekoppelt mit dem Eva- 
luierungsmechanismus zum Sarnrneln und Spei- 
chern in einem Speicher einer Anzahl der Ergeb- 
nisse der rekursiven Evaluierung der Abfrage und 
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der Unterabfragen gemaB der Berechnung eines 
Gcsamtcrgcbnisscs der Abfrage; 

16. Verfahren fiir die Verarbeitung einer Abfrage zur 
Wiedergewinnung von Informationen aus einer Daten- 
bank, umfassend: ' 5 

A) das Auffinden einer Anzahl an Merkmalen 
und Merkmalsfragmenten in einem Index; 
H) das Tdentifizieren einer Anzahl an Unterabfra- 
gen einer Anzahl an Ebenen, die in der Abfrage 
enthalten sind, und das rekursive Evaluieren der io 
Unterabfragen mit Hilfe der gefundenen Merk- 
male und Merkinalsfragniente; und 
O das Sammeln und Speichern einer Anzahl an 
Ergebnissen der rekursiven Evaluierung der Ab- 
frage und der Unterabfragen nach der Berechnung 15 
eines Gesamtergebnisses der Abfrage. 

17. Computeiprogramrh-Produkt fur die Verarbeitung 
einer Abfrage fur die Wiedergewinnung von Informa- 
tionen aus einer Datenbank, wobei das Computerpro- 
gramrn-Produkt ein vom Computer ausfuhrbares Pro- 20 
gramm umfaBt, welches sich auf einem vom Computer 
lesharen Medium befindet, wobei das vom Computer 
ausfuhrbare Programm umfaBt: 

A) einen ersten Codeabschnitt zur Auffindung ei- 
ner Anzahl an Merkmalen und Merkmalsfrag- 25 
menien in einem Index; 

B) einen zweiten Codeabschnitt zur Identifizie- 
rung einer Anzahl an Unterabfragen einer Anzahl 
an Ebenen, die in der Abfrage enthalten sind, und 
zum rekursiven Evaluieren der Unterabfragen mit 30 
Hilfe der gefundenen Merkmale und Merkmals- 
fragmente; und 

C) einen dritten Codeabschnitt zum Sammeln 
und Speichern einer Anzahl an Ergebnissen der 
rekursiven Evaluierung der Abfrage und der Un- 35 
terabfragen nach der Berechnung eines Gesamter- 
gebnisses der Abfrage. 
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